妄谈数据垄断,可能让中国错失超越美国的重大机遇 | 冰川观察
数据监管具有复杂性,是一个新的事物,涉及多方面的复杂因素,要切实做到保护个人隐私、数据安全,又不能因此遏制数字技术的创新与应用,可以说是任重而道远,每一步都需要审慎而为。
冰川思想库特约撰稿 | 南之默
最近,有关大数据垄断或要对其进行严格监管的声音渐多,这不免让人担心。对于大数据等新兴科技领域,是否需要严行监管,还需要审慎而为。
毕竟,在大数据刚刚起步的今天,我们对于大数据的本质还并未完全掌握。更何况,数据对于诸如人工智能等数字技术的创新与进步具有重要的意义。
▲某智能音箱发布会现场
我们知道,人工智能在最近几年终于迎来的爆发式的发展,这与深度学习概念的提出与突破有关。但问题是,相关理论早在上世纪八十年代就已经提出,却为何要迟至2006年才取得进展?原因就在于数据与计算能力的提升。
这让深度学习领域鼻祖杰弗里·辛顿不得不感叹:过去的失败只是源于没有足够的数据与计算能力。可见数据于人工智能技术的重要性。也正是因为这样的缘故,数据被视为数字经济时代的新能源。
从技术发展的角度上看,数据与人工智能技术之间是一种良性循环。算法借助海量数据的训练,不断提升人工智能某项技术的水平。
反过来,人工智能技术的成熟落地,转化为应用,可以产生更多的数据,进一步提升其技术水平,并因此能拓展至更多相关的领域。
比如我们熟悉的语音识别、人脸识别等技术。通过数据训练,提升语音识别或人脸识别的水平。一旦这些技术走出实验室,转化为实际应用,因为用户的广泛使用,为其提供更多的语料或图像素材,不仅能继续提升其识别能力,还能向周边诸如情感计算、情绪情感识别等方向拓展。
所以,数据与技术之间是一种良性的循环,如果这种互动可以不断持续不断的话。
相反,一旦数据生产与采集被遏制,或者受到严格的监管,那么则可能意味着相关技术的创新可能因此变得缓慢,甚至停滞。
▲杭州一家KFC餐厅首推刷脸支付功能
现在,许多研究报告已经普遍将人工智能为代表的数字技术视为新的生产要素与未来经济增长的新引擎。
咨询机构埃森哲就认为,人工智能可以为许多国家的经济增长带来提拔作用。从经济总增加值(约等于国内生产总值)角度看,到2035年,人工智能有潜力使中国的经济年增速提高1.6%,美国提升2.0%,英国提升1.4%,德国提升1.6%。
因此,相关新兴数字技术的停滞或缓慢发展,将不可避免对经济与社会发展产生负面影响。而对数据采集的遏制,却仅仅是出于可能出现数据垄断或数据寡头,所以需要对数据进行严格的监管。
的确,如果市场上可能出现垄断或寡头现象,我们毫无疑问需要对其进行反垄断、监管。不过,在采取行动之前,我们可能需要厘清,是否存在数据垄断的可能以及趋势。
在我看来,现在谈数据垄断,有些为时过早,甚至可能很难存在所谓的数据垄断问题。
我们需要明白和理解的是,数字化世界与现实世界的不同。首先是数据形态的不同,同一数据可以为不同领域的企业、机构获得,它具有可复制性。同时,由于数据形成的背后是人,是人的行为导致了数据的源源不断,并且因此具有动态性、时效性。
▲数据的背后,是人在控制
从根本上说,没有人能阻止相同数据的产生并且被不同的机构所获取,除了人本身。如果公众为了避免隐私、数据的被采取而停止使用任何智能设备,这在数字时代,几乎上是很不现实的做法。
其次,即使拥有数据优势,也未必能形成技术优势与市场优势。因为仅仅拥有海量数据,这还远远不足够。正如大数据本身,绝不是仅仅意味着数据体量大,还需要相关的算法,对数据进行分析、挖掘、计算、应用,这样数据才能显示出其价值。并且,由于某些数据具有时效性,如果不能在短时间内迅速处理好数据,那些这样数据也将变得毫无价值。
从这一点上说,拥有海量的数据,并不意味着拥有了绝对的市场优势。优秀的算法加上一定的数据,同样可以在市场上形成自己独特的优势。
比如在人工智能领域,现在已有研究人员,正试图通过生成对抗网络或迁移学习方法,来减少对大量数据的过分依赖。正如煤、石油等能源,其之所以重要,不是因为它们本身就有多厉害,而是借助机器使它们具备的能量有了可用武之地,并且不同的机器让其发挥的效用也各不相同。
同样,数据要发挥其价值,则需要依赖于复杂设计的算法和机器的处理能力。世界上并不缺乏拥有海量数据,却同样没落的企业,比如美国的Myspace。所以,拥有海量数据,绝对不意味绝对优势。
再者,当前的社会仍有许多未数据化的领域。眼下的社会绝不是数据化过多,而是过少。为何人工智能在有些垂直行业还不能大显身手,原因就在于这些行业数据化远远不够,甚至可能连基本的电子化都不完善。
更何况,每一次技术的创新或变化,都将能开拓出新的数据世界,产生同样庞大的数据。比如几年前移动互联网的出现,就产生了滴滴这样级别的企业,交通出行领域因此迅速数据化,产生出大量的数据。
同样,随着诸如智能驾驶、智能家居等的出现与广泛应用,车联网与物联网技术也将开拓出新的数据世界。我们现在的社会,数据量似乎已经很庞大,但相信随着现实世界更广泛、更深入地数据化,今天看似海量的数据,再过几年,可能就是沧海一粟了。
当然,我们不得不正视的一个问题是,以人工智能为代表的数字技术的崛起,必然意味着数据产业的迅速扩大。人类社会也在发生巨大的变化。过去我们会认为,虚拟世界与现实社会是两个完全不同的地方。但现在,两者的界线正变得越来越模糊。
虚拟世界,正在成为人类的组成部分。
当数字化、智能化成为趋势,自然也将因此与数据产业相伴而生地出现一些问题,比如数据安全问题、个人隐私保护问题、数据流动与共享等问题。特别是由于科技进步的迅速如此之快,相关法律法规未能快速适应调整,使得当前在这一产业中存在一定的模糊、灰色空间。但本质上,这些问题与数据垄断无关,与数据的权利有关。
通过法律规范数据的采集与使用保护用户的数据权利是必要的,即数据监管需要管理的是数据获取的正当性、合法性和保护隐私性,而不应该对数据有恐惧感,甚至可能因此导致过度监管。
面对一个新事物,需要给予一定的观察期,否则一旦过度监管就可能丧失产业的发展机遇,进而丧失在创新领域的先机。
以发展的眼光来看,如果说此前中国在其它互联网领域落后于美国,那么以人工智能为代表的新兴科技,则为中国提供了超越美国的机遇。但人工智能相关技术的发展,离不开数据、算法与计算能力三驾马车的共同驱动。我们在寻求规范数据产业发展,规范数据采集与使用的同时,也需要充分考虑到技术发展的需要与问题之间的平衡。
现在,国外已有学者对此进行了深入的研究,但不得不承认是,数据监管具有复杂性,是一个新的事物,涉及多方面的复杂因素,要切实做到保护个人隐私、数据安全,又不能因此遏制数字技术的创新与应用,可以说是任重而道远,每一步都需要审慎而为。
(投稿邮箱:622007913@qq.com)
(实习编辑 莫子野)
不熬夜为什么这么重要?2017年诺贝尔生理或医学奖得主给出了答案
汇聚思想,分享观点
新公众号ID:ibingchuansxk
本文部分图片来源于网络,
欢迎权利人与我们联系以便支付稿酬,
请于后台留言。